文章目录
聚类分析的结果都知道,就是获得几个类别,那么我们怎么知道这些类别是合理的呢?这里提供一个方法,就是利用means方法,检验各个类别在所有变量上的差异,如果差异显著,我们就可以认为分类结果是可靠的。
方法/步骤
- 假设我们现在已经得到了聚类的结果,所有的case都已经分类了,我们看到在数据窗口已经形成了若干个新的变量,显示了case的分类结果,如图所示,这里显示了三个聚类的结果,分别是把数据分为3、4、5类的结果
- 在菜单栏上执行:analyse–compare means–means,打开平均数对话框
- 将指标变量都放入因变量框中,然后将分组变量(聚类分析得到的变量)放入因变量中
- 点击ok按钮,开始运行数据,并显示结果
- 我们会看到三种分类结果各自的平均数,下面的三个表格分别是将case分为5、4、3类的结果,当然这种方法只能计算出各组平均数,如何检验平均数的差异就要用到下面的方法
- 在菜单栏上执行:analyse–compare means–one way anova
- 将指标变量放到因变量列表,将分组变量放入factor中,然后点击ok,开始处理数据
- 我们看到下面的这个表格就是对平均数的差异的检验了,看sig这一列,除了一个指标,其他指标都达到了显著的水平,这说明这种分类还是比较有效的。
转载请注明来自DataScience.
邮箱: 675495787@qq.com